人类仍在执行许多高精度(DIS)任务,而这是自动化的理想机会。本文提供了一个框架,该框架使非专家的人类操作员能够教机器人手臂执行复杂的精确任务。该框架使用可变的笛卡尔阻抗控制器来执行从动力学人类示范中学到的轨迹。可以给出反馈以进行交互重塑或加快原始演示。董事会本地化是通过对任务委员会位置的视觉估算来完成的,并通过触觉反馈进行了完善。我们的框架在机器人基准拆卸挑战上进行了测试,该机器人必须执行复杂的精确任务,例如关键插入。结果显示每个操纵子任务的成功率很高,包括盒子中新型姿势的情况。还进行了消融研究以评估框架的组成部分。
translated by 谷歌翻译
Causal deep learning (CDL) is a new and important research area in the larger field of machine learning. With CDL, researchers aim to structure and encode causal knowledge in the extremely flexible representation space of deep learning models. Doing so will lead to more informed, robust, and general predictions and inference -- which is important! However, CDL is still in its infancy. For example, it is not clear how we ought to compare different methods as they are so different in their output, the way they encode causal knowledge, or even how they represent this knowledge. This is a living paper that categorises methods in causal deep learning beyond Pearl's ladder of causation. We refine the rungs in Pearl's ladder, while also adding a separate dimension that categorises the parametric assumptions of both input and representation, arriving at the map of causal deep learning. Our map covers machine learning disciplines such as supervised learning, reinforcement learning, generative modelling and beyond. Our paradigm is a tool which helps researchers to: find benchmarks, compare methods, and most importantly: identify research gaps. With this work we aim to structure the avalanche of papers being published on causal deep learning. While papers on the topic are being published daily, our map remains fixed. We open-source our map for others to use as they see fit: perhaps to offer guidance in a related works section, or to better highlight the contribution of their paper.
translated by 谷歌翻译
This article focuses on the control center of each human body: the brain. We will point out the pivotal role of the cerebral vasculature and how its complex mechanisms may vary between subjects. We then emphasize a specific acute pathological state, i.e., acute ischemic stroke, and show how medical imaging and its analysis can be used to define the treatment. We show how the core-penumbra concept is used in practice using mismatch criteria and how machine learning can be used to make predictions of the final infarct, either via deconvolution or convolutional neural networks.
translated by 谷歌翻译
The clinical interest is often to measure the volume of a structure, which is typically derived from a segmentation. In order to evaluate and compare segmentation methods, the similarity between a segmentation and a predefined ground truth is measured using popular discrete metrics, such as the Dice score. Recent segmentation methods use a differentiable surrogate metric, such as soft Dice, as part of the loss function during the learning phase. In this work, we first briefly describe how to derive volume estimates from a segmentation that is, potentially, inherently uncertain or ambiguous. This is followed by a theoretical analysis and an experimental validation linking the inherent uncertainty to common loss functions for training CNNs, namely cross-entropy and soft Dice. We find that, even though soft Dice optimization leads to an improved performance with respect to the Dice score and other measures, it may introduce a volume bias for tasks with high inherent uncertainty. These findings indicate some of the method's clinical limitations and suggest doing a closer ad-hoc volume analysis with an optional re-calibration step.
translated by 谷歌翻译
医学图像分割模型的性能指标用于衡量参考注释和预测之间的一致性。在开发此类模型中,使用了一组通用指标,以使结果更具可比性。但是,公共数据集中的分布与临床实践中遇到的案例之间存在不匹配。许多常见的指标无法衡量这种不匹配的影响,尤其是对于包含不确定,小或空参考注释的临床数据集。因此,可能无法通过此类指标来验证模型在临床上有意义的一致性。评估临床价值的维度包括独立于参考注释量的大小,考虑参考注释的不确定性,体积计和/或位置一致性的奖励以及对空参考注释正确分类的奖励。与普通的公共数据集不同,我们的内部数据集更具代表性。它包含不确定的,小或空的参考注释。我们研究了有关深度学习框架的预测的公开度量指标,以确定哪些设置共同指标可提供有意义的结果。我们将公共基准数据集进行比较而没有不确定,小或空参考注释。该代码将发布。
translated by 谷歌翻译
未知的非线性动力学通常会限制前馈控制的跟踪性能。本文的目的是开发一个可以使用通用函数近似器来补偿这些未知非线性动力学的前馈控制框架。前馈控制器被参数化为基于物理模型和神经网络的平行组合,在该组合中,两者都共享相同的线性自回旋(AR)动力学。该参数化允许通过Sanathanan-Koerner(SK)迭代进行有效的输出误差优化。在每个Sk-itteration中,神经网络的输出在基于物理模型的子空间中通过基于正交投影的正则化受到惩罚,从而使神经网络仅捕获未建模的动力学,从而产生可解释的模型。
translated by 谷歌翻译
技能在就业市场和许多人力资源(HR)过程中起着核心作用。在其他数字经验之后,当今的在线工作市场有候选人希望根据他们的技能看到正确的机会。同样,企业越来越需要使用数据来确保其劳动力中的技能保持未来。但是,有关技能的结构化信息通常缺少,并且基于自我或经理评估的流程已证明与所得数据的采用,完整性和新鲜度有关。鉴于明确或仅隐含地描述了数千种可能的技能标签,并且缺乏精细注释的培训语料库,提取技能是一项艰巨的任务。以前的技能提取工作过于简化任务,将其用于明确的实体检测任务,或者基于手动注释的培训数据,如果应用于完整的技能词汇,这是不可行的。我们根据遥远的字面匹配,提出了一个用于技能提取的端到端系统。我们提出并评估了几种负面验证数据集中的几种负面抽样策略,以提高技能提取对隐式提及技能的推广,尽管在遥远的监督数据中缺乏这种隐性技能。我们观察到,使用ESCO分类法从相关技能中选择负面示例会产生最大的进步,并且在一个模型中结合三种不同的策略进一步提高了性能,在RP@5中最多可达8个百分点。我们介绍了基于ESCO分类法的手动注释评估基准,以进行技能提取,并在其上验证模型。我们发布基准数据集以进行研究目的,以刺激对任务的进一步研究。
translated by 谷歌翻译
利用基于文本的节点属性的节点分类具有许多真实的应用程序,从学术引用图中的纸张主题到社交媒体网络中用户特征的分类范围。最新的节点分类框架(例如Giant)使用两阶段管道:首先嵌入图节点的文本属性,然后将所得嵌入的嵌入到节点分类模型中。在本文中,我们消除了这两个阶段,而是开发了建立在巨人基于端到端巨型(E2EG)的端到端节点分类模型。在我们的方法中,主体和辅助分类目标的串联利用导致了更强大的模型,从而使BERT主链可以切换为蒸馏编码器,其参数数量减少了25%-40%。此外,模型的端到端性质提高了易用性,因为它避免了链接多个模型进行节点分类的需求。与OGBN-ARXIV和OGBN产品数据集的巨型+MLP基线相比,我们的模型能够在换电环境(+0.5%)中获得稍好的精度,同时将模型培训时间最多减少40%。我们的模型也适用于电感设置,优于巨型 +MLP高达 +2.23%。
translated by 谷歌翻译
尽管骰子损失是医学图像分割中的主要损失函数之一,但大多数研究都忽略了其导数,即使用梯度下降时优化的真实电动机。在本文中,我们强调了在缺少或空的标签存在下骰子丢失的特殊作用。首先,我们制定一个理论基础,对骰子丢失及其导数进行了一般描述。事实证明,减少尺寸$ \ phi $和平滑项$ \ epsilon $的选择是无处不在的,并且极大地影响了其行为。我们找到并提出了$ \ phi $和$ \ epsilon $的启发式组合,它们在细分设置中使用,带有缺失或空标签。其次,我们使用两个公开可用的数据集在二进制和多类分段设置中验证这些发现。我们确认,$ \ phi $和$ \ epsilon $的选择确实是关键的。选择了$ \ phi $,因此减少的单个元素(和类)元素以及可忽略不计的$ \ epsilon $进行,骰子损失与缺失的标签自然交易,并且与最近缺少标签的最新适应性相似。选择$ \ phi $,以使减少量发生在多个批处理元素上,或以$ \ epsilon $的启发式值进行,骰子损失正确处理空标签。我们认为,这项工作强调了一些基本观点,并希望它鼓励研究人员更好地描述他们对未来工作中骰子损失的确切实施。
translated by 谷歌翻译
在过去的几年中,自动睡眠评分的研究主要集中在开发日益复杂的深度学习体系结构上。但是,最近,这些方法仅实现了边际改进,通常以需要更多数据和更昂贵的培训程序为代价。尽管所有这些努力及其令人满意的表现,但在临床背景下,自动睡眠期临时解决方案并未被广泛采用。我们认为,由于很难训练,部署和繁殖,大多数对睡眠评分的深度学习解决方案在现实世界中的适用性受到限制。此外,这些解决方案缺乏可解释性和透明度,这通常是提高采用率的关键。在这项工作中,我们使用经典的机器学习来重新审视睡眠阶段分类的问题。结果表明,通过传统的机器学习管道可以实现最新的性能,该管道包括预处理,功能提取和简单的机器学习模型。特别是,我们分析了线性模型和非线性(梯度提升)模型的性能。我们的方法超过了两个公共数据集上的最新方法(使用相同的数据):Sleep--EDF SC-20(MF1 0.810)和Sleep-eDF ST(MF1 0.795),同时在Sleep-eDF上取得了竞争成果SC-78(MF1 0.775)和质量SS3(MF1 0.817)。我们表明,对于睡眠阶段评分任务,工程特征向量的表现力与深度学习模型的内部学表现相当。该观察结果为临床采用打开了大门,因为代表性功能向量允许利用传统机器学习模型的可解释性和成功记录。
translated by 谷歌翻译